逆强化学习相关论文
本文通过分析驾驶人驾驶行为生成机制,构建了类人行为决策策略(HBDS)。它具有匹配驾驶行为生成机制的策略框架,通过最大熵逆强化学习得......
随着病态建筑综合症的出现,人们开始意识到封闭的室内环境对室内人员的健康会产生不利的影响,对建筑室内环境的舒适度给予了极大的......
随着逆强化学习的快速发展,并得益于深度学习强大的表达能力,深度逆强化学习的应用场景越来越广泛。然而,逆强化学习的成功依赖高......
随着社会的发展、科技的进步,空调在人们日常生活和工作中变得不可或缺。然而,空调的大量使用导致能耗的不断增加,并且由于空调系......
图像描述任务致力于赋予计算机“看图说话”的能力,即在给定输入图片的条件下自动生成符合自然语言表达习惯且真实反应图像内容的......
计算机生成兵力(Computer Generated Force,CGF)是作战仿真领域的关键前沿技术之一。为解决现有仿真系统中CGF智能性与拟人性不足......
导航规划是移动机器人在环境中自主作业的重要基础性问题。传统导航规划仅仅考虑机器人移动的安全性,将所有静态物体和动态物体都......
针对自动驾驶车辆换道过程中存在的车辆规划轨迹与人类驾驶员决策轨迹偏差较大问题,开发了一种基于驾驶员轨迹特征学习的换道轨迹......
经过多年发展,深度强化学习的理论研究已经逐步成熟,在解决高维原始输入数据问题和控制决策问题上表现得尤为突出。但是面对复杂的......
作为解决序贯决策的机器学习方法,强化学习采取持续的"交互-试错"机制,实现智能体(Agent)与环境的不断交互,从而学得完成任务的最......
为提高无人作战飞机(UCAV)自主决策效能,提出基于逆强化学习的空战态势评估函数优化方法。以现有的正例与反例两类空战数据为样本......
强化学习中报酬函数主要是根据经验人为设定的,难以保证最优性,学徒学习同样需要求取报酬函数。逆向强化学习通过学习演示轨迹或专家......
随着强化学习在自动机器人控制、复杂决策问题上的广泛应用,强化学习逐渐成为机器学习领域中的一大研究热点.传统强化学习算法是一......
针对逆强化学习算法在训练初期由于专家样本稀疏所导致的学习速率慢的问题,提出一种基于生成对抗网络(Generative Adversarial Net......
期刊
智能时代正在到来,智能技术对生活的方方面面正在产生翻天覆地的影响,为了更好好的应对未来战争形态的改变,必须重视使用学习的方......
模仿学习一直是人工智能领域的研究热点。模仿学习是一种基于专家示教重建期望策略的方法。近年来,在理论研究中,此方法和强化学习......